Search CORE

16 research outputs found

Felszíni eset : absztrakt eset - rövid előadás

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2003
Field of study

Ez a cikk a magyar nyelv felszini eseteinek nagy számából eredő problémák egy lehetséges megoldásával, független absztrakt tulajdonságok bevezetésével kisebb csoportokra bontással, és ennek az előnyeivel foglalkozik

University of Szeged

Tanulságok magyar mondatellenőrző nyelvi adatainak átvitelénél

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2018
Field of study

University of Szeged

Lehet-e automatikus családfaépítő programot készíteni?

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2022
Field of study

University of Szeged

State of the Hungarian spell checkers

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2017
Field of study

University of Szeged

A magyar helyesírás-ellenőrzők mai állása

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2017
Field of study

A helyesírás-ellenőrzők jósága függ az előállítás módjától, karbantartásától, de az adatbázis méretének növekedésével objektív korlátokba ütközik a minőség. Jelen cikk kitér az objektív minősítés módszertanára, elvi korlátaira. Összeveti az elérhető helyesírás-ellenőrzőket. Megkísérli pártatlan módon összevetni az elérhető programokat, és megmutatni, hogy a nyelvi adatbázis építésénél alkalmazott módszereknek milyen előnyük, hátrányuk van. A cikk végén keresi a további hatékony fejlesztés irányát

University of Szeged

Szösszenet az elveszett morfémákért : az alaki analógiák haszna

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2020
Field of study

A jelenlegi morfológiai elemzők gyakorlati okok miatt elég pragmatikus módon készültek. A céljuk, aránylag kis munkával fedjék le a magyar nyelvű szövegeinek szóalakjait minél kevesebb hibával. Ha a célt elérték, a szabályszerű eseteket jól leírták, a deviáns, kisebb gyakorisággal előforduló eseteket kivételként, egyedileg kezelik. A vizsgálataim szerint sokkal kevesebb kivétel van. A szavak végződése szerinti csoportosítással felderíthetők azok a szavak közötti összefüggések, melyek a korábbi adatbázisokból hiányoznak. A módszer segítségével elfeledett vagy csak leíró nyelvészek által említett szógyökök, toldalékok kerülnek napvilágra. Sőt a feltárás eredményeként pontosíthatóak a praktikus célra készült nyelvészeti, nyelvi tárak. The current morphological analyzers have been designed pragmatically for practical purposes. Their goal is to cover the word forms in Hungarian texts with relatively little effort and with as few mistakes as possible. Once the goal has been achieved, regular case affixes, marks, and verbal conjugation endings are well described in a formal way, but most derivative affixes and rare case suffixes are treated individually as exceptions. In my research, I found that there are far fewer exceptional word forms in Hungarian. By clustering word forms by their endings, new relationships, new roots, new morphemes can be discovered that are missing from earlier databases. By clustering word forms by their endings, new relationships among roots, morphemes can be discovered that are missing from earlier databases. One can simplify morphological descriptions without limiting their power. Even a complete morphological description of an unknown language can be generated based on a large corpus solely. Moreover, if not only similarities of endings, but clusters of ending patterns are used to group word forms, then many hidden word roots and suffixes can be discovered that have been forgotten altogether, or mentioned only by descriptive linguists. As a result of the method, semantic dependences might be discovered, and linguistic collections, databases made for practical purposes can be corrected, improved as well

University of Szeged

Szófaji beosztás névszói csoportok elemzéséhez

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2004
Field of study

A klasszikus nyelvosztályozás - főnév, melléknév, számnév stb. - nem elégséges a gépi elemzéshez. A névszók pontosabb kategorizálása lehetőséget ad a többértelműségek számának csökkentésére, és pontosabb mondatelemzésié. Jelen cikk egy finomabb, de jelentéstant nem használó felosztást javasol. A felosztás szerepet játszik a szóalaktanban és a mondattanban egyaránt. Segítségével pontosítható a névszói szerkezetek határa és definiáltsága, mely hasznosnak bizonyult a korábbi projektekben, de használata várhatóan a fordítási projektben elengedhetetlenné válik

University of Szeged

Surface case : abstract case - project notes, summary

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2003
Field of study

University of Szeged

The reliability of statistics in linguistics notes to a dictionary extension

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2015
Field of study

Nowadays statistical tools are often used tool in linguistics, but the reliability of these methods is rarely examined. In natural language processing, statistical methods have their boundaries, and one should pay more attention to them. I try to show, when and how can we estimate its boundaries

University of Szeged

Statisztika megbízhatósága a nyelvészetben : széljegyzetek egy szótárbővítés ürügyén

Author: Naszódi Mátyás
Publication venue
Publication date: 01/01/2015
Field of study

Manapság szinte korlátlan mennyiségben lehet természetes nyelvű szövegeket elérni a www jóvoltából. Emiatt a nyelvi kutatásoknál, eszközök fejlesztésénél erősen támaszkodnak nyelvi statisztikákra. A megbízhatóság kérdésével viszont kevesen foglalkoznak, pedig ez kulcskérdése a tömeges adatok felhasználhatóságának. Ez a cikk azzal foglalkozik, milyen jellegű objektív korlátai vannak a statisztikáknak, és hogyan lehet becsülni a megbízhatóságot

University of Szeged